Génération de résumés par abstraction complète
نویسنده
چکیده
This Ph.D. thesis is the result of several years of research on automatic text summarization. Three major contributions are presented in the form of published and yet to be published papers. They follow a path that moves away from extractive summarization and toward abstractive summarization. The first article describes the HexTac experiment, which was conducted to evaluate the performance of humans summarizing text by extracting sentences. Results show a wide gap of performance between human summaries written by sentence extraction and those written without restriction. This empirical performance ceiling to sentence extraction demonstrates the need for new approaches to text summarization. We then developed and implemented a system, which is the subject of the second article, using the Fully Abstractive Summarization approach. Though the name suggests otherwise, this approach is better categorized as semi-extractive, along with sentence compression and sentence fusion. Building and evaluating this system brought to light the great challenge associated with generating easily readable summaries without extracting sentences. In this approach, text understanding is not deep enough to provide help in the content selection process, as is the case in extractive summarization. As the third contribution, a knowledge-based approach to abstractive summarization called K-BABS was proposed. Relevant content is identified by pattern matching on an analysis of the source text, and rules are applied to directly generate sentences for the summary. This approach is implemented in a system called ABSUM, which generates very short and content-rich summaries. An evaluation was performed according to today’s standards. The evaluation shows that hybrid summaries generated by adding extracted sentences to ABSUM’s output have significantly more content than a state-ofthe-art extractive summarizer. Mots clés: Automatic Summarization, Abstractive Summarization, Natural Language Generation, Natural Language Processing
منابع مشابه
Transformée de Mellin des intégrales- fibres associées aux singularités isolées d’intersection complète quasihomogènes
Résumé. La transformée de Mellin de l’intégrale -fibre est calculée pour certaines singularités isolées d’intersection complète quasihomogènes (surtout singularités unimodales de la liste de Giusti et de Wall). On montre la propriété de la symétrie des spectres de GaussManin (Théorème 3.1) et on met à jour la structure de réseaux des pôles de la transformée de Mellin, exprimée au moyen des donn...
متن کاملTransformée de Mellin des intégrales- fibres associées à l’intersection complète non-dégénérée
Résumé. La transformée de Mellin de l’intégrale -fibre est calculée pour certaines classes d’intersection complète non-dégénérée affine, surtout les cas nommés simpliciables. On met à jour la structure de réseaux des pôles de la transformée de Mellin à l’aide des données topologiques qui décrivent la structure de Hodge de la variété affine. On établit la relation de l’intégrale-fibre avec la fo...
متن کاملModélisation déclarative et sémantique, ontologies, assemblage et intégration de modèles, génération de code Declarative and semantic modelling, ontologies, model linking and integration, code generation
Ce dossier traite de la représentation des interfaces des modèles dans une ontologie. Il est question des bénéfices retirés de cette approche lorsqu’il s’agit d’assembler et d’intégrer des modèles (partage, réutilisation, qualité, fiabilité, robustesse). Il est présenté l’ontologie MIO (Model Interface Ontology) et une mise en pratique de l’approche sur le projet Seamless-IP par la communauté A...
متن کامل